Research Technical Daily Life Game

Academic Projects Links About Travellings 🚇

Back

Tags: #goal-conditioned rl

Dec 30, 2025

RL笔记（21）：目标导向的强化学习 (Goal-Conditioned RL)

从解决单一任务到解决一类任务：详解目标导向 RL 的数学形式化。涵盖通用价值函数近似 (UVFA) 理论，以及解决稀疏奖励难题的核心技术——事后经验回放 (HER)。

9 min read

© 2026 菊花花 & Site policy Astro theme powered